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摘要 “为 促进 经 济 发 展 、 社 会 进步 与 科技 创新 ， 必 须 大 力 推动 开放 科学 ， 开 放 数 据 成 为 开放 科学 的 重要 组 
成 。 开 放 数 据 基础 设施 由 物理 实体 和 虚拟 系统 组 成 ， 是 支撑 开放 数据 和 满足 不 同 领 域 数 据 应 用 需求 的 基础 ， 
其 发 展 是 信息 技术 演进 的 客观 过 程 。 文 章 分 析 了 开放 数据 基础 设施 的 要 素 ， 阐 明了 开放 数据 基础 设施 对 促进 
开放 科学 实施 的 意义 和 积极 作用 ， 分 析 了 我 国 开放 数据 基础 设施 的 现状 ， 针 对 我 国 开放 数据 基础 设施 存在 的 
不 足 与 挑战 提出 了 发 展 建议 。 


天 键 词 ”开放 数据 ， 开 放 数 据 基础 设施 ， 开 放 科 学 ， 地 球 大 数据 ， 科 学 数据 中 心 


当前 ， 开 放 科学 进入 全 球 共识 阶段 ， 科 研 人 员 基 ”新 的 知识 体系 ,开放 科学 强调 整个 科学 过 程 的 透明 ， 
于 活动 论 、 方 法 论 、 方 式 论 、 过 程 论 、 文 化 论 和 实践 ”“” 误 励 开放 获取 与 合作 。 在 更 深层 次 的 理解 上 ， 开 放 科 
论 等 从 不 同 视角 对 开放 科学 给 出 了 不 同 的 定义 。 开 ”学 是 科学 研究 范式 的 转变 ””， 将 深刻 改变 人 类 科学 研 
放 科学 将 科学 作为 一 种 共同 利益 加 以 推广 ， 包 括 分 享 ” 究 、 科 学 发 现 的 方式 ， 对 于 加 强 科技 合作 ， 共 同 探索 
数据 、 方 法 、 结 果 和 由 此 产生 的 知识 等 。 作 为 一 种 全 ”解决 全 球 性 挑战 具有 重要 意义 。 
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加 强 开放 数据 基础 设施 建设 ， 推 动 开放 科学 发 展 EE 


为 推动 全 球 开放 科学 的 发 展 ，2021 年 ， 联 合 国 
教科 文 组 织 (UNESCO ) 大 会 第 41m A DUI BOB 
过 《开放 科学 建议 书 》 (Recommendation on Open 
Science) 5 ， 意 在 让 开放 科学 更 透明 、 更 可 及 ， 进 而 
使 其 更 加 公平 和 包容 。 这 不 仅 为 开放 科学 提供 了 国际 
发 展 方向 ， 还 为 个 人 、 机 构 、 国 家 、 地 区 和 国际 等 不 
同 层面 提供 了 促进 交流 、 建 立信 任 的 渠道 。 

近年 来 ， 随 着 大 科学 装置 的 建设 、 重 大 科学 实验 
的 实施 ， 以 及 科学 传感器 和 传 感 网 络 的 广泛 应 用 ， 产 
生 了 多 源 、 异 构 、 海 量 的 科学 数据 。 数 据 已 不 仅 是 研 
究 过 程 中 事实 或 观察 的 结果 ， 更 成 为 研究 的 实体 工 
具 。 数 据 密集 型 科学 发 现成 为 大 数据 时 代 的 科学 研究 
新 范式 ""。 

开放 科学 数据 是 开放 科学 的 核心 要 素 之 一 "。 通 常 
由 政府 和 机 构 组 织 制定 开放 数据 政策 ， 定 义 共享 数据 
类 型 、 共 享 对 象 、 共 享 条 件 。 实 现 科学 数据 的 公开 使 
用 、 重 复 使 用 、 长 期 保存 和 更 新 发 布 ， 将 会 大 力促 进 
开放 科学 的 发 展 ， 提 升 科技 创新 活动 的 透明 度 、 可 重 
复 性 、 协 作 性 ， 并 可 最 大 化 科学 对 社会 发 展 的 价值 ”。 


1 开放 科学 数据 


科学 数据 ， 作 为 最 基本 、 最 活路 的 一 类 科技 资 
源 ， 既 是 科技 创新 活动 的 重要 产 出 ， 也 是 新 一 轮 创 新 
活动 和 经 济 社会 发 展 的 重要 基础 ， 具 有 巨大 的 应 用 和 
开发 价值 ， 在 全 球 诸多 国家 机 构 得 到 高 度 重 视 。 

开放 科学 数据 是 指 可 公开 获取 ， 并 可 通过 下 载 、 
复制 、 分 析 、 再 加 工 等 方式 ， 用 于 系统 构建 和 任何 其 
他 应 用 目的 科学 数据 …”。 

1.1 国际 开放 科学 数据 的 发 展 与 现状 

在 美国 ， 开 放 科学 数据 已 成 为 美国 “信息 自由 、 
开放 政府 ”的 重要 组 成 ; 德国 科学 基金 会 ( DFG ) 
2010 年 发 布 的 《研究 数据 操作 指南 》 (Guidelines on 
the Handling of Research Data) ， 明 确 “ 科 学 数据 的 共 
享 与 再 利用 对 科学 研究 甚至 人 类 社会 都 具有 巨大 意 
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U” D 国际 科学 理事 会 数据 委员 会 (CODATA ) 
2019 年 发 布 的 《科研 数据 北京 宣言 》 (The Beijing 
Declaration on Research Data) 上 指出， 公共 经 费 资助 
产 出 的 科学 数据 应 尽 可 能 在 全 球 范围 内 共享 重复 使 
用 。 以 Dimensions 平台 统计 数据 为 例 ，2012 一 2021 年 
全 球 开放 科学 数据 集合 计 9918 741 条 ， 其 中 中 国 拥 
有 253 441 条 ， 继 美国 之 后 排名 全 球 第 2 位 ; 在 研究 领 
域 上 ， 数 据 量 排名 前 3 位 的 学 科 分 别 为 信息 与 计算 机 
科学 、 信 息 系统 、 地 球 科学 (图 1) 。 

为 推进 开放 数据 更 加 规范 化 ，2016 年 FAIR Jt] 
可 查找 ( findable ) 、 可 获取 (accessible ) 、 可 
交互 (interoperable) 、 可 重复 使 用 (reusable ) 应 
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图 1 2012—2021 年 全 球 开 放 科 学 数据 集 分 布 信息 
Figure 1 
to 2021 


(a) 不 同 国家 数据 集 分 布 信息 ; (b) 不 同学 科 数 据 集 分 布 信息 
(a) Distribution of different countries; (b) Distribution of different 


disciplines 
数据 来 源 : Dimensions 平台 


Data resource: Dimensions platform 
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运 而 生 。 作 为 FAIR 原则 的 补充 ，CARE 原则 一 一 集 
体 收益 〈collective benefit) 、 质 量 保证 (authority to 
control) 、 责 任 (responsibility ) 、 伦 理 〈ethics ) WHE 
导 以 目标 为 导向 ， 发 挥 数据 的 创新 作用 。FAIR 原则 强 
调 技术 进步 ， 而 CARE 原则 更 侧重 政策 变革 ， 两 者 相 
辅 相 成 '"。 

全 球 开 放 数 据 在 众多 研究 领域 莲 勃 发 展 。 作 为 开放 
科学 的 引领 者 ， 天 文学 领域 越 来 越 多 的 数据 资源 实现 了 
即时 开放 ， 如 美国 大 型 综合 巡天 望远镜 (LSST ) 。 在 
空间 科学 领域 的 探索 中 ， 美国 和 和 加拿大 最 为 积极 ， 欧 洲 
以 试点 为 主 ， 俄 罗斯 和 日 本 则 强调 国际 合作 ; 在 高 能 物 
理 领域 ， 依 托 大 科学 装置 的 数据 积累 与 协作 管理 经 验 为 
全 球 大 规模 数据 合作 共享 提供 了 典范 。 

1.2 我 国 开放 科学 数据 发 展 与 现状 

作为 国家 科技 创新 发 展 和 经 济 社会 发 展 的 重要 基 

础 性 战略 资源 ， 开 放 科 学 数据 已 在 我 国 全 社会 达成 高 


度 共 识 。 


1.2.1 历史 上 形成 了 丰富 的 、 

据 资 源 

据 不 完全 统计 ， 到 20 世纪末， 我国 已 建成 53000 一 
6000 个 规模 不 等 、 质 量 参差 的 科学 数据 库 ， 涉 及 科学 
技术 的 各 个 领域 。 在 科学 数据 采集 和 积累 方面 ， 初 步 
形成 了 以 部 门 为 主体 、 科 研 院 所 和 高 等 院 校 互 补 的 格 
局 ， 并 逐步 建立 了 专门 的 数据 管理 机 构 和 国际 数据 合 
作 与 交换 渠道 "。 

据 《 国家 科学 数据 资源 发 展 报告 (2018) 》 统 
计 ， 截 至 2017 年底， 我 国有 效 管理 与 保存 的 科学 数据 
资源 总 量 共计 约 83.72 PB。 其 中 ， 生 命 科 学 与 医学 领 
域 、 地 球 与 环境 科学 领域 、 物 理 与 化 学 领域 、 对 地 观 
测 领 域 、 天 文 与 空间 科学 等 5 个 领域 数据 积累 分 别 为 
26.81 PB、24.48 PB、16.64 PB、9.73 PB 和 5.27 PB。 


窗 盖 各 个 领域 的 科学 数 


1.2.2 科学 数据 开放 共享 被 逐步 纳入 我 国政 策 法 规制 
度 体系 
我 国 一 直 重 视 科 学 数据 的 汇 交 管理 与 开放 共享 。 
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先后 从 国家 、 部 门 多 层面 出 台 相 关 政 策 ， 并 从 行动 上 
予以 落实 。 

2006 年 ， 国 务 院 发 布 《国家 中 长 期 科学 和 技术 
发 展 规划 纲要 ( 2006 一 2020 年 ) 》， 明 确 提出 要 建 
设 数字 科技 平台 ,促进 科学 数据 共享 。 我国 逐 步 开始 
形成 由 以 政府 、 行 业 机 构 和 领域 数据 中 心 为 主体 的 数 
据 政策 体系 "”"。2015 年 ， 国 务 院 印 发 《促进 大 数据 
发 展 行动 岗 要 》， 提 出 发 展 科 学 大 数据 的 具体 行动 。 
2018 年 ， 国 务 院 办 公 厅 印发 《科学 数据 管理 办 法 》， 
进一步 明确 了 科学 数据 管理 与 共享 的 职责 ， 并 对 科学 
数据 的 定义 、 管 理 、 责 任 主体 、 使 用 方法 、 使 用 范围 
和 保密 安全 进行 了 清晰 的 界定 ， 为 科学 数据 的 开放 和 


共享 黄 定 了 基础 ”。 
1.2.3 积极 参与 并 推动 国际 科学 数据 合作 共享 


当前 国际 科学 理事 会 CISCO ) 有 两 大 数据 组 
织 一 一 国际 数据 委员 会 (CODATA ) 和 世界 数据 系统 
(WDS， 前 身 为 世界 数据 中 心 WDC ) ， 主 要 致力 于 将 
科学 技术 各 领域 从 事 数据 工作 的 科学 家 组 织 起 来 ， 利 
用 国际 网 络 构建 全 球 尺度 的 科学 数据 交换 体系 一。 
1988 年 我 国 加 入 WDS， 并 于 当年 建立 了 天 文 、 空 间 
科学 、 海 洋 、 气 象 、 地 质 、 地 震 、 地 球 物理 、 冰 川 
冻 土 、 可 再 生 资源 与 环境 9 个 数据 中 心 。 目 前 ， 天 
文 数 据 中 心 、 空 间 科 学 数据 中 心 和 海洋 数据 中 心 均 
为 WDS 的 常规 成 员 机 构 。1984 年 我 国 加 入 CODATA。 
2011 年 ， 我 国学 者 在 CODATA 提出 “ 手 拉手 合作 伙 
伴 计 划 ”， 旨 在 促进 国际 项 目 之 间 的 合作 ， 帮 助 重复 
利用 已 有 数据 资源 ， 减 少 重复 劳动 ， 提 高 科研 成 果 产 
出 ， 加 速 科研 成 果 转化 ， 消 减 数字 鸿沟 王 ”。 

2018 年 立项 的 中 国 科 学 院 战略 性 先导 科技 专项 
(A 类 ) “地 球 大 数据 科学 工程 ”( CASEarth ) 遵循 从 
开放 数据 到 开放 科学 的 发 展 潮流 ， 将 人 工 智能 赋 能 地 球 
大 数据 ， 打 造 集 数据 、 计 算 、 服 务 于 一 体 的 数据 共享 新 
模式 外。 同时 ，CASEarth 促进 地 球 科 学 数据 的 整合 ， 
实现 多 学 科 数 据 关联 分 析 和 信息 融合 ， 驱 动 重大 科学 发 
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现 与 决策 支持 ， 应 对 全 球 可 持续 发 展 等 重大 挑战 。 

在 CASEarth 基础 上 ， 可 持续 发 展 大 数据 国际 研 
究 中心 于 2021 年 9 月 6 日 正式 成 立 ， 旨 在 为 解决 中 国 
力 至 全 球 重大 可 持续 发 展 问题 提供 基础 理论 、 技 术 方 
法 、 决 策 支 持 和 智库 服务 支撑 ”1。 这 是 我 国 积 极 推 
动 大 数据 服务 于 《联合 国 2030 年 可 持续 发 展 议程 》 的 
重要 举措 和 创新 方向 1。 

1.2.4 积极 创办 数据 期 刊 和 创建 数据 仓储 ， 推 动 数据 
开放 共享 

随 着 开放 数据 理念 不 断 深 入 ， 我 国 也 开始 了 科学 
数据 期 刊 的 建设 。 中 国 科学 院 计算 机 网 络 信息 中 心 于 
2016 年 创办 的 《中 国 科 学 数据 》 是 我 国 目前 首 批 面 
向 多 学 科 领 域 的 数据 期 刊 之 一 "。 生 物 学 、 遥 感 科学 
与 技术 和 图 书 情报 学 等 领域 享有 较 高 声誉 的 学 术 期 刊 
也 陆续 设置 了 数据 论文 专栏 "。 由 国际 数字 地 球 学 会 
和 CASEarth 共同 主办 的 Big Earth Data F 2017 ^F. 12 H 
创刊 ， 是 全 球 首 本 聚焦 大 数据 的 地 学 刊物 ， 旨 在 为 从 
事 地 球 大 数据 的 采集 、 管 理 、 处 理 、 分 析 和 可 视 化 研 
究 的 学 者 搭建 一 流 的 国际 学 术 交 流 平台 "1。 

我 国 还 在 不 同 领域 创建 了 数据 仓储 平台 ， 来 促进 
各 领域 数据 资源 的 开放 共享 。 国 内 多 个 数据 平台 还 被 
国际 认证 为 数据 仓储 中 心 ， 从 而 更 好 地 保障 了 我 国 科 
学 家 的 数据 主权 1。 


2 我 国 开 放 数 据 基 础 设施 的 现状 与 问题 

开放 数据 基础 设施 是 支撑 开放 数据 和 满足 不 同 科 
学 领域 研究 的 共享 设施 ， 其 发 展 是 信息 技术 面向 数字 
化 、 智 能 化 演进 的 必然 结果 。 数 据 中 心 是 开放 数据 基 
础 设施 的 具体 体现 ， 以 数据 为 核心 ， 通 过 深度 整合 计 
算 、 存 储 、 网 络 和 软件 资源 ， 实 现 开放 数据 的 价值 最 
大 化 。 

开放 数据 基础 设施 的 要 素 包 括 数据 、 物 理 、 技 
术 、 制 度 4 部 分 。 其中， 数据 要 素 是 开放 数据 基础 设 
施 的 第 一 要 素 ， 包 括 数据 集 、 数 据 标识 和 数据 注册 
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Ax. 物理 要 素 是 指 面向 数据 标准 、 存 储 、 管 理 、# 
享 、 分 析 、 使 用 所 需 的 软 硬 件 基础 设施 ; 技术 要 素 
面 指向 开放 数据 基础 设施 的 核心 技术 研发 ， 实 现 协作 
式 和 多 学 科 数 据 分 析 的 开放 计算 和 数据 处 理 能 力 ; 制 
度 要 素 为 开放 数据 和 开放 数据 基础 设施 的 使 用 和 管理 
提供 政策 指导 。 
2.1 开放 数据 基础 设施 对 促进 开放 科学 实施 的 意义 

和 积极 作用 

开放 数据 基础 设施 是 科研 范式 变革 的 重要 助 推 
剂 ， 是 重要 科技 突破 的 “新 引擎”" 。 随 着 互联 
网 、 大 数据 与 人 工 智能 的 发 展 ， 科 学 发 现 的 路 径 进 
入 了 新 阶段 下 。 例 如 ， 中 国 科学 院 高 能 物理 研究 所 与 
国家 高 能 物理 科学 数据 中 心 联合 研 建 的 大 规模 分 布 
式 数 据 服 务 基础 设施 平台 ， 通 过 超 高 速 网 络 将 国际 
上 重要 的 高 能 物理 科学 数据 及 计算 资源 进行 整合 ， 
为 粒子 物理 、 天 体 物理 、 中 子 科学 、 光 子 科 学 等 领域 
的 科学 发 现 提供 数据 服务 。 高 海拔 宇宙 线 观 测 站 项 目 
(LHAASO ) 利用 该 平台 部 署 了 Coryda 数据 处 理 系 
统 ， 全 面 收集 和 处 理 超 高 能 伽 马 射线 等 宇宙 线 数据 。 
以 2022 年 为 例 ，LHAASO 全 年 共 采 集 了 11 PB 的 数 
Jm. 包含 10 万 亿 个 宇宙 线 事例 ; 数据 和 计算 资源 向 全 
球 开放 ， 全 年 的 数据 访问 和 处 理 量 达到 448 PB, TET. 
宙 线 前 沿 研 究 方面 获得 了 “PeV 超 高 能 光子 ”“ 超 高 
质量 暗物质 寿命 ”等 多 项 重大 科技 成 果 。 
2.2 我 国 开放 数据 基础 设施 的 基础 与 优势 

开放 数据 基础 设施 的 建设 需求 因 所 服务 对 象 不 同 
及 应 用 差异 而 呈现 多 样 化 5"。 开 放 数 据 基础 设施 主要 
可 分 为 两 类 : OD 大 科学 装置 ， 根 据 共性 需求 提供 服务 
的 国家 基础 设施 ， 是 海量 数据 的 生产 单元 ; D 科学 数 
据 中 心 ， 属 于 集中 式 数据 基础 设施 ， 可 支持 跨 学 科 领 
域 的 综合 研究 。 中 国 科学 院 在 我 国 开放 数据 基础 设施 
建设 和 体系 化 运行 中 发 挥 了 重要 作用 。 
2.2.1 大 科学 装置 

我 国 大 科学 装置 最 早 可 追溯 到 为 “两 弹 一 星 ” 
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研制 任务 建设 的 大 型 科研 装置 。20 HE 80 年代 末 
中 国 科 学 院 率先 建设 北京 正 负 电子 对 撞 机 ; 我 国 
“ 九 五 ”“ 十 五 ”期 间 建 设 了 11 项 大 科学 装置 ; 
“十 一 五 ”之 后 进入 快速 发 展 时 期 ，“ 十 二 五 ”期 
间 形 成 了 建成 22 项 、 在 建 16 项 的 布局 ; “十 三 五 ” 
“十 四 五 ”期 间 则 逐步 形成 以 综合 性 国家 科学 中 心 为 
依托 的 大 科学 装置 建设 规划 中"。 目 前 ， 我 国 在 建 和 运 
行 的 大 科学 装置 总 量 约 50 余 个 ， 部 分 装置 综合 水 平 进 
AGER "USO" PU, 

大 科学 装置 分 为 三 大 类 : O 专用 研究 设施 ， 主 要 
为 特定 学 科 领 域 的 重大 科学 技术 目标 建设 ; © 公共 
实验 设施 ， 主 要 支撑 多 学 科 领 域 的 基础 和 应 用 研究 服 
务 ; @ 公益 科技 设施 ， 主 要 为 国家 经 济 建设 、 国 家 安 
全 和 社会 发 展 提供 基础 数据 ”"。 前 两 类 装置 一 般 通过 
实验 与 观测 产生 大 量具 有 极 高 科学 价值 的 数据 ， 提 供 


储 一 管理 一 计算 分 析 一 可 视 化 ”流程 ;研发 可 持续 发 
展 目标 (SDGs ) 数据 产品 生产 系统 ， 实 现 TB 量 级 数 
据 交 互 式 在 线 分 析 ， 以 及 各 类 指标 在 线 计算 和 可 视 
化 展示 ; WE SDGs 专用 存储 库 等 核心 功能 ， 支 持 全 
Fk SDGs 数据 资源 的 持续 汇聚 与 开放 共享 ; 建设 支撑 
地 球 大 数据 管理 、 处 理 与 分 析 的 专 有 环境 ， 有 具备 每 
T 1 000 万 亿 次 的 双 精 度 浮 点 超级 计算 能 力 ，50 PB 数 
据 存储 能 力 ，10000 CPU 核心 云 计算 能 力 。 目 前 ， 平 
台 已 汇聚 数据 量 达 16 PB ， 可 面向 公众 、 科 研 人 员 、 
决策 者 三 类 典型 场景 ， 提 供 “一 站 式 ” 数 据 计 算 、 分 
Br. Hon. HERZ”, 已 通过 CODATA 的 评估 ， 科 
学 数据 服务 于 174 个 国家 和 地 区 。 

(2) 国家 科学 数据 中 心 。2019 年 ， 为 进一步 完 
善 科技 资源 共享 服务 体系 ， 推 动 科技 资源 向 社会 开放 
共享 ， 科 学 技术 部 、 财 政 部 联合 认定 了 20 个 国家 科 


给 专业 领域 和 多 学 科 用 于 科学 研究 ; 第 三 类 装置 通过 
科学 考察 、 综 合 检测 等 手段 获取 科学 数据 及 资源 ， 为 
科学 研究 及 国家 发 展 提供 保障 。 

大 科学 装置 是 科学 数据 最 重要 的 生产 源 。 我 国 与 世 
界 发 达 国家 都 高 度 重 视 大 科学 装置 发 展 ， 但 在 对 大 科学 
装置 的 地 位 和 作用 规定 的 内 涵 的 定位 上 有 很 大 差别 ， 主 
要 体现 在 我 国 更 加 突出 “目标 牵引 、 问 题 导 向 ”。 在 国 
家 有 关 部 门 的 统一 部 署 下 ， 我 国 大 科学 装置 布局 逐步 完 
善 、 运 行 更 加 高 效 、 产 出 更 加 丰硕 ， 这 对 促进 我 国 科 学 
技术 事业 发 展 起 到 了 巨大 的 支撑 作用 ， 为 解决 国家 发 展 
中 遇 到 的 关键 瓶 贷 问 题 作 出 了 突出 贡献 。 

2.2.2 科学 数据 中 心 

(1) 国际 科学 数据 中 心 。 国 际 科学 数据 中 心 是 
指 面向 国家 和 全 球 发 展 部 署 ， 服 务 解 决 重大 科学 问 
BE. ， 推 动 技术 创新 ， 促 进 可 持续 发 展 的 基础 设施 。 
例如 ， 可 持续 发 展 大 数据 国际 研究 中 心 (CBAS ) 是 
典型 的 国际 科学 数据 中 心中 ， 其 研发 的 大 数据 平台 
系统 ( SDGs 大 数据 平台 ) 整合 了 基础 地 理 、 遥 感 、 
地 面 监测 、 社 会 统计 等 多 种 数据 ， 贯 通 “ 大 数据 存 
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学 数据 中 心 ( 表 1) ,涵盖 了 高 能 物理 、 空 间 科学 与 
天 文 、 生 物 基因 、 环 境 与 生态 、 地 质 与 地 震 、 农 林 、 
气象 等 领域 ， 负 责 我 国 相关 领域 科学 数据 的 汇 交 与 
共享 、 科 学 计算 、 数 据 技术 人 研究 等 工作 。 至 2021 年 
底 ， 国 家 科学 数据 中 心 汇集 的 数据 超过 100 PB ， 每 
年 被 访问 的 数据 达 数 百 PB， 提 供 的 科学 计算 服务 超 
过 1 亿 CPU 小 时 ,为 科学 发 现 、 技 术 创新 和 国民 经 济 
提供 了 重要 支撑 。 

(3) 中 国 科学 院 科 学 数据 中 心 体系 。 为 落实 《 科 
学 数据 管理 办 法 》，2019 年 2 月 中 国 科学 院 出 台 《 中 
国 科 学 院 科学 数据 管理 与 开放 共享 办 法 》， 并 启动 
建设 了 以 “总 中 心 - 学 科 中 心 -所 级 中 心 ” 三 类 科学 数 
据 中 心 为 核心 ， 安 全 体系 、 运 行 体 系 和 评价 体系 共同 
保障 与 驱动 的 一 体 化 科学 数据 中 心 网 络 “…。 初 步 建 
成 中 国 科学 院 科 学 数据 中 心 体 系 ( 表 2 ) ， 在 支持 我 
国 科 技 创新 方面 取得 了 积极 成 效 ， 在 支撑 国家 重大 战 
略 、 重 大 工程 建设 中 发 挥 了 积极 作用 。 
2.3 我 国 开放 数据 基础 设施 发 展 面临 的 挑战 
我 国 早 期 的 开放 数据 基础 设施 可 靠 性 较 差 ， 且 相 
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表 1 20 个 国家 科学 数据 中 心 
Table 1 List of 20 National Science Data Centers 


序号 司 家 平台 名 称 农 托 单位 主管 部 门 

1 ”国家 高 能 物理 科学 数据 中 心 中 国 科学 院 高 能 物理 研究 所 中 国 科 学 院 

2 国家 基因 组 科学 数据 中 心 中 国 科 学 院 北 京 基因 组 研究 所 中 国 科学 院 

3 ”国家 微生物 科学 数据 中 心 中 国 科 学 院 微生物 研究 所 中 国 科 学 院 

4 ”国家 空间 科学 数据 中 心 中 国 科 学 院 国 家 空间 科学 中 心 中 国 科 学 院 

5 ”国家 天 文科 学 数据 中 心 中 国 科 学 院 国家 天 文 台 中 国 科学 院 

6 ”国家 对 地 观测 科学 数据 中 心 中 国 科 学 院 空 天 信息 创新 研究 院 中 国 科学 院 

y 国家 极地 科学 数据 中 心 中 国 极地 研究 中 心 

8 习 家 青藏 高 原 科 学 数据 中 心 中 国 科 学 院 青 藏 高 原 研究 所 中 国 科 学 院 

9 ”国家 生态 科学 数据 中 心 中 国 科 学 院 地 理科 学 与 资源 研究 所 中 国 科 学 院 

10 ”国家 材料 腐蚀 与 防护 科学 数据 中 心 ”北京 科技 大 学 教育 部 

11 ”国家 冰川 冻 土 沙漠 科学 数据 中 心 中 国 科学 院 寒 区 旱 区 环境 与 工程 研究 所 中 国 科学 院 

12 ”国家 计量 科学 数据 中 心 中 国 计 量 科学 研究 院 悦 家 市 场 监督 管理 总 局 
13 ”国家 地 球 系统 科学 数据 中 心 中 国 科 学 院 地 理科 学 与 资源 研究 所 中 国 科 学 院 

14 ”国家 人 口 健康 科学 数据 中 心 中 国医 学 科学 院 中 华人 民 共 和 国 国 家 卫生 健康 委员 会 
15 ”国家 基础 学 科 公共 科学 数据 中 心 中 国 科 学 院 计算 机 网 络 信息 中 心 中 国 科 学 院 

16 ”国家 农业 科学 数据 中 心 中 国 农业 科学 院 农业 信息 研究 所 农业 农村 部 

17 ”国家 林业 和 草原 科学 数据 中 心 中 国 林 业 科学 研究 院 资源 信息 研究 所 国家 林业 和 草原 局 

18 ”国家 气象 科学 数据 中 心 国家 气象 信息 中 心 中 国 气 象 局 

19 ”国家 地 震 科学 数据 中 心 中 国 地 震 台 网 中 心 中 国 地 震 局 

20 ”国家 海洋 科学 数据 中 心 习 家 海洋 信息 中 心 然 资源 部 


表 2 ”中 国 科 学 院 科学 数据 中 心 体系 (总 中 心 -学 科 中 心 ) 


Table 2 Data Science Centers of Chinese Academy of Sciences 


序号 中 国 科学 院 平台 名 称 依托 单位 类 别 
1 ” ”中国 科学 院 科学 数据 总 中 心 国 科学 院 计算 机 网 络 信息 中 心 总 中 心 
院 10 个 研究 机 构 GA) 学 科 中 心 
院 植物 研究 所 学 科 中 心 
到 科学 院 空 天 信息 创新 研究 院 学 科 中 心 
院 海洋 研究 所 学 科 中 心 
到 科学 院 物理 研究 所 学 科 中 心 
国 科学 院 脑 科 学 与 智能 技术 卓越 创新 中 心 学 科 中 心 
到 科学 院 过 程 工程 研究 所 学 科 中 心 
院 动物 研究 所 学 科 中 心 


i 
[ 

也 

Ji 


2 11 家 国家 科学 数据 中 心 
3 植物 科学 数据 中 心 

4 ”地 球 大 数据 科学 数据 中 心 
8 海洋 科学 数据 中 心 
6 凝聚 态 物质 科学 数据 中 心 
7 脑 科学 数据 中 心 

8 化 学 化 工科 学 数据 中 心 


H 
说 
Jit 


HE US ES HU EUN S EUN D E 


E 
Jit 


9 于 细胞 与 再 生 医学 科学 数据 中 心 
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对 孤立 。 过 去 20 年 间 ， 国 家 重点 鼓励 创建 数据 门户 ， 
重点 解决 科学 数据 的 “可 检索 、 可 浏览 、 可 共享 ”的 
共性 基础 问题 ， 在 开放 数据 公共 平台 和 配套 设施 建设 
方面 取得 了 较 大 的 进展 。 但 总 体 来 看 ， 在 促进 数据 重 
用 、 促 进 科研 创新 和 社会 开放 创新 等 方面 仍 面临 巨大 
挑战 踢 。 上 有 具体 存在 4 个 方面 的 问题 。 

(1) 当前 建设 规模 不 能 满足 日 益 增长 的 数据 管理 
和 使 用 的 需要 。 从 建设 规模 和 财政 资金 投入 而 言 ， 目 
前 较为 重视 的 仍然 是 大 科学 装置 层级 或 国家 级 数据 基 
础 设施 的 建设 ,还 无 法 满足 整个 科技 界 乃 至 社会 对 开 
放 科学 数据 管理 和 使 用 的 需要 。 

(2) 现 有 标准 体系 和 技术 能 力 仍 无 法 满足 建设 需 
求 ""。 目前， 针对 大 数据 管理 和 处 理 标准 、 算 法 及 工 
具 层 出 不 穷 ， 但 建设 满足 各 类 需求 的 开放 数据 基础 设 
施 挑战 仍然 很 大 ， 包括 : O 缺乏 有 效 的 标准 体系 和 查 
询 手段 ; O 缺乏 对 体系 架构 的 标准 化 建 模 ， 导 致 不 同 


除 上 述 问 题 外 ,我 国 对 开放 数据 基础 设施 建设 的 
政策 尚 缺 乏 系统 性 设计 和 全 方位 考虑 ， 各 级 政府 、 各 
类 机 构 发 布 的 相关 政策 意见 主要 侧重 于 “ 硬 ” 条 件 的 
建设 ， 而 对 “ 软 ” 内 容 建 设 的 重视 和 支持 不 足 。 


3 加 强 我 国 开 放 数 据 基础 设施 建设 的 思考 与 
建议 
开放 科学 数据 需要 强大 的 、 可 持续 的 基础 设施 和 
健全 的 政策 制度 支持 ， 开 放 数 据 基础 设施 的 实施 路 径 
应 以 充分 挖掘 数据 价值 为 目标 ， 使 数据 “ 存 得 下 、 流 
得 动 、 用 得 好 ”。 针 对 我 国 开放 数据 基础 设施 建设 ， 
提出 以 下 4 点 建议 。 
3.1 加 强 顶 层 设计 ， 统 一 规划 布局 开放 数据 基础 设 


施 建设 ， 建 立 综合 性 的 国家 数据 中 心 和 国际 数 
据 中 心 


开放 数据 基础 设施 外 延 广 、 内 涵 丰 富 ， 需 要 加 强 


学 科 不 同行 业 的 数据 很 难 重 用 ， 系 统 间 集 成 和 互通 困 
难 ; @ 缺乏 对 数据 管理 标准 化 环节 的 重视 ，@ 缺乏 有 
效 的 标准 使 用 和 升级 指南 ， 导 致 历史 遗留 系统 和 新 系 
统 之 间 的 兼容 较为 困难 。 

(3) 建设 模式 单一 ， 支 持 数 据 整合 、 数 据 分 析 和 
支撑 科技 决策 的 功能 较 弱 。 当 前 ， 国 内 开放 数据 基础 
设施 的 资金 来 源 单一 ， 跨 部 门 跨 领域 的 合作 少 ， 存 在 
自 成 体系 或 者 重复 建设 的 情况 。 开 放 数 据 基础 设施 目 
前 主要 支持 对 同 领域 同类 型 的 数据 整合 功能 ， 而 对 不 
同 领域 来 源 的 不 同类 型 的 数据 集 进行 整合 、 协 同 数据 
分 析 和 支撑 科技 决策 的 功能 较 弱 。 

(4) 在 科学 数据 长 期 保存 和 再 利用 方面 缺乏 整体 
规划 。 我 国 大 科学 装置 产生 的 科学 数据 规模 巨大 ， 长 
期 利用 价值 高 。 尤 其 是 在 大 科学 装置 或 大 科学 项 目 结 
东 运 行 后 ， 需 要 有 效 的 数据 保存 与 管理 、 软 件 与 计算 
支撑 、 完 善 的 技术 档案 来 确保 科学 数据 的 长 期 可 用 。 
目前 除 少数 领域 开始 研究 制定 长 期 保存 和 再 利用 的 规 
划 外 ,我 国 还 缺乏 相关 的 整体 规划 。 
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国家 层面 的 项 层 设计 和 实施 路 径 规划 ， 以 保障 开放 数 
据 基 础 设施 政策 制定 的 连贯 性 和 可 操作 性 。 

建议 : CD 开放 数据 基础 设施 的 建设 应 以 开放 数据 
平台 建设 为 核心 。 开 放 数 据 平台 以 数据 为 主体 ， 通 过 
高 度 融 合 存储 、 计 算 、 网 络 和 软件 资源 ， 实 现 开 放 数 
据 的 最 大 价值 的 挖掘 。 一 方面 ， 统 筹 开 放 数 据 平台 建 
设 ， 研 究 确立 开放 数据 平台 的 整体 框架 、 服 务 体系 、 
认证 标准 和 评价 机 制 ; 男 一 方面 ， 重 视 开放 数据 平 
台 的 可 持续 发 展 ， 从 制定 差异 化 数据 政策 、 提 供 数据 
采集 和 使 用 的 评价 、 提 供 支 持 服 务 3 个 方面 入 手 ， 进 
一 步 优化 投入 机 制 ， 鼓 励 引 导 不 同 创新 主体 参与 数据 
发 展 ， 形 成 以 国家 、 部 委 和 国家 数据 中 心 运行 机 构 投 
入 为 主导 ， 多 元 化 投入 相 结合 的 数据 资源 建设 和 服务 
运行 的 资金 保障 体系 ， 确 保 开 放 数 据 平台 的 可 持续 发 
Ro © 开放 数据 基础 设施 建设 有 助 于 打破 数据 壁 全 。 
我 国 现 有 开放 数据 基础 设施 主要 集中 在 各 类 学 科 数 据 
中 心 或 共享 平台 ， 不 能 适应 以 大 数据 、 物 联网 、 人 工 
智能 为 代表 的 新 技术 革命 蓬勃 发 展 ， 无 法 加 速 多 领域 
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科学 数据 交叉 应 用 和 向 现实 生产 力 的 转化 。 建 设 综合 
性 基础 性 国家 数据 中 心 和 国际 数据 中 心 是 必然 的 解决 
途径 。 可 持续 发 展 大 数据 国际 研究 中 心 已 经 进行 了 先 
行 探索 ， 并 取得 了 显著 成 效 ， 为 推动 我 国 的 开放 数据 
基础 设施 的 跨越 式 发 展 提供 了 经 验 积 累 。 
3.2 坚持 合作 开放 的 科学 数据 基础 设施 云 建设 - 云 安 

全 - 云 应 用 的 实施 路 径 

开放 数据 基础 设施 能 有 效 提 升 科研 的 效率 、 参 
与 度 与 可 见 性 ， 加 强 科 研 质 量 与 严谨 度 ， 促 进 科 人 研 
团队 跨 学 科 合作 。2019 年 ， 在 CODATA 北 京 会 议 上 ， 
中 国 科学 家 代表 提出 协作 共 建 “全 球 开放 科学 云 ” 
(GOSC ) 的 倡议 ， 目 前 已 与 全 球 主要 信息 基础 设施 
和 国际 组 织 、 平 台 达 成 广泛 共识 并 建立 定期 对 话机 
制 ， 研 发 构建 了 首 个 中 欧 跨 洲际 云 联 邦 实验 床 。 

建议 : 未 来 ,我 国 应 在 国际 大 科学 计划 、 大 科学 
装置 的 牵引 和 推动 让， 充分 发 挥 我 国 具 有 明显 优势 的 
数据 资源 的 主导 作用 ， 着 力 推动 相关 数据 分 析 方法 及 
工具 集合 的 研发 ， 加 强 与 国际 组 织 、 国 家 之 间 的 沟通 
交流 和 培训 ， 积 极 参与 并 推动 国际 层面 的 数据 共享 与 
合作 应 用 ; 同时 ， 应 充分 发 挥 中 国 科学 院 开放 基础 设 
施 的 引领 和 推动 作用 ， 合 作 建 立国 际 共 享 的 开放 数据 
云 服务 体系 。 
3.3 营造 融通 数据 生态 ， 发 展 基于 开放 科学 的 创新 

驱动 发 展 的 范式 

以 开放 数据 获取 为 前 导 发 展 起 来 的 开放 科学 和 公 
民 科 学 ， 与 可 持续 科学 密切 相关 。 面 向 发 展 与 合作 ， 
科技 创新 应 该 主要 体现 在 将 科技 进步 用 于 创造 新 需 
求 、 新 应 用 、 新 业态 和 新 市 场 ， 同 时 创新 科技 合作 模 
Mo 

近年 ， 欧 美 等 国 新 布局 的 一 批 科 学 数据 基础 设施 
呈现 问题 导向 、 打 破 科 学 数据 学 科 领 域 边界 的 趋势 。 
例如 ,融合 神 经 科学 、 分 布 式 计算 技术 的 欧洲 脑 研 究 
基础 设施 ;支持 能 源 消耗 和 绿色 交易 的 欧洲 计算 / 通 
信和 实验 大 型 研究 基础 设施 等 。 这 些 设施 有 望 充分 调动 
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多 领域 数据 资源 ， 融 合 自 然 科 学 各 领域 、 自 然 科 学 与 
社会 科学 ,成 为 推进 交叉 融合 和 跨 领 域 互 操 作 的 先行 
者 ， 营 造 跨 学 科 、 跨 尺度 、 跨 时 空 的 科学 数据 共享 生 
态 。 


建议 : 鼓励 发 起 和 建设 科学 、 社 会 问题 导向 的 科 
学 数据 基础 设施 ， 调 动 盘 活 多 学 科 、 跨 领域 的 科学 数 
据 资源 ， 为 解决 大 规模 、 复 杂 性 科学 问题 和 社会 挑战 
提供 支撑 。 
3.4 发 展 基 于 开放 科学 的 创新 驱动 发 展 的 范式 ， 重 

塑 国 际 科 技 合 作 治理 模式 

开放 科学 有 利于 新 科技 革命 和 产业 变 章 突破 经 典 
技术 极限 ， 形 成 新 规则 、 新 政策 、 新 评估 标准 和 新 指 
标 体系 。 开 放 科学 通过 对 科学 技术 的 兼 收 并 车 ， 耦 合 
了 不 同 地 域 、 不 同 领域 、 不 同 团 队 的 科研 优势 ， 利 于 
促进 全 人 类 都 能 够 站 在 巨人 肩膀 上 做 科研 ， 形 成 累积 
效应 。 开 放 科学 数据 是 实现 开放 科学 的 基本 条 件 之 
一 。 条 承 开放 科学 理念 ， 有 利于 迅速 提升 我 国 科 研 实 
力 。 

开放 数据 基础 设施 作为 开放 科学 数据 的 载体 ， 可 
为 政策 制定 者 提供 更 为 全 面 的 综合 数据 和 信息 ， 为 全 
球 性 挑战 的 综合 政策 制定 提供 方案 ， 同 时 也 可 为 科研 
人 员 的 跨 领 域 、 跨 区 域 合作 提供 新 路 径 。 

建议 : 遵循 从 开放 数据 到 开放 科学 的 发 展 潮流 ， 
利用 云 计算 、 大 数据 、 区 块 链 等 先进 技术 与 方法 ， 将 
人 工 智能 赋 能 大 数据 ， 打 造 集 数据 -计算 -服务 于 一 体 
的 数据 共享 新 模式 ,促进 多 学 科 数 据 关 联 分 析 和 信息 
融合 ,深化 多 领域 数据 的 综合 应 用 ， 了 驱动 重大 科学 发 
现 与 决策 支持 。 
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Strengthening Open Data Infrastructure and Promoting Open Science 


GUO Huadong"' CHEN Hesheng YAN Dongmei" LIJianhui” CHEN Gang? 
HE Guojin" MAJuncai LIANG Dong" KONG Lingyi™ 
(1 International Research Center of Big Data for Sustainable Development Goals, Beijing 100094, China; 
2 Aerospace Information Research Institute, Chinese Academy of Sciences, Beijing 100094, China; 
3 Institute of High Energy Physics, Chinese Academy of Sciences, Beijing 100049, China; 
4 Computer Network Information Center, Chinese Academy of Sciences, Beijing 100083, China; 

5 Institute of Microbiology, Chinese Academy of Sciences, Beijing 100101, China ) 
Abstract To promote economic development, social progress, and scientific and technological innovation, it is necessary to strengthen 
scientific cooperation and information sharing. Open data has emerged in response and become a seemingly inevitable development in the 
evolution of digital technology. Open data, however, must be supported by infrastructure composed of physical entities and virtual systems 
that meet the needs of data applications in many fields. Constructing and strengthening open data infrastructure should therefore be considered 
important objectives of information technology development. This study analyzes the elements of open data infrastructure and expounds its 
significant positive role in implementing open science. Based on an analysis of the current state and substantial development of China's open 
data infrastructure, this study puts forward relevant measures and suggestions in view of the shortcomings and challenges China has faced with 


its open data infrastructure. 
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